# xpath 解析，在 xml 文档中搜索的一门语言
# html 是 xml 的一个子集

# 安装 lxml 模块

from lxml import etree

xml = '''
<book>
    <id>1</id>
    <name>野花遍地香</name>
    <price>1.23</price>
    <author>
        <nick id = '1001'>周大强</nick>
        <nick id = '1002'>周芷若</nick>
        <nick id = '1003'>周宇</nick>
        <div>
            <nick>热热热热热  1  </nick>
        </div>
        <span>
            <nick>热热热热热  2  </nick>
            <div>
                <nick>热热热热热  3  </nick>
            </div>
        </span>
    </author>
</book>
'''

tree = etree.XML(xml)
# result = tree.xpath('/book') # '/' 表示层级关系，第一个 '/' 表示根节点
result = tree.xpath('/book/name/text()')    # text() 拿文本
print(result)

result = tree.xpath('/book/author/*/nick/text()')    # * 任意节点，通配符
print(result)

result = tree.xpath('/book/author//nick/text()')    # // 所有的后代节点
print(result)

